480 词

抛弃单一的对话框形态,趣丸集团关联团队通过“世界地图+分支剧情”的 RPG 化改造,推动 AI 陪伴从“单点聊天”向“共创冒险”演进。
截图2026-03-31_21.40.08@2x

交互范式 RPG 化

由“谜境”开发商(上海小煎饼信息科技,系趣丸集团关联实体)研发的“叽伴” App 正在重构 AI 社交玩法。该应用跳出了传统的纯文本对话框架,引入设定世界地图与室内场景扩展。AI 角色具备初步的空间与场景感知逻辑,支持“立绘焕装”(依据所处地图场景自动切换视觉表现)。用户支持自定义地图,将交互场景从扁平的聊天窗口升级为带有环境上下文的角色扮演(TRPG)冒险。

记忆实体化与叙事非线性

应用底层引入了多智能体(Multi-Agent)协同机制,不仅核心 AI 伴侣具备长期记忆,次要 NPC 同样拥有独立的性格基座与记忆轴。AI 不再仅提供即时文本反馈,而是能将用户共同经历提取为虚拟资产(如基于历史事件主动生成专属“手记”或赠送道具礼物)。配合新增的剧情分支系统,用户的每一次对话不仅是交流,更是直接触发状态转移、影响后续故事树走向的决策节点。

307 词

腾讯开放国民级社交通讯接口,使用户能在聊天窗口直接调度本地 AI Agent。
IMG_0856
IMG_0857

官方插件 ClawBot 落地

2026年3月22日,微信正式上线“ClawBot”插件。用户更新微信后(路径:我—设置—插件),可通过终端指令、扫码或复制命令将本地 OpenClaw 接入微信。连接建立后,用户可在常规聊天界面发送文本指令,驱动 Agent 跨应用执行任务并实时接收回调结果。

腾讯端云协同基建部署

配套微信接口开放,腾讯同步上线多层级部署方案:云端版 Lighthouse(云端虾)、自研版 WorkBuddy 以及本地版 QClaw。此外,腾讯云启动全国17城线下免费巡装计划,提供端到端环境配置,直接降低开发者与普通用户的算力调度和运维门槛。

567 词

腾讯将开源框架 OpenClaw 封装为低门槛产品 QClaw 并开启大规模公测,通过微信小程序打通移动端与 PC 端壁垒,标志着 Local Agent 向非技术人群的普及实质性落地。
CleanShot_2026-03-18_at_21.28.20@2x

微信交互链路重构(V0.1.9 版本)

2026年3月18日,腾讯云正式宣布 QClaw 迎来版本更新,核心动作是将移动端控制入口由“微信客服号”升级为“微信小程序”。
该升级直接解决了此前需在二级菜单寻找机器人的交互痛点。当前版本已支持通过小程序直接上传或接收 PC 端文件。根据官方披露的迭代路线图,小程序端即将接入微信原生多模态能力(语音指令、图片解析),并支持远程创建定时任务、实时回传任务流状态及动态切换底层大模型。

“一键端到端”的极简封装与生态接入

QClaw 由腾讯电脑管家团队主导研发,其技术本质是开源项目 OpenClaw(开发者俗称“龙虾”)的商业化开箱即用版本。

  • 运行环境:支持 Windows 与 Mac 双端部署。用户无需配置 Python 环境或命令行,实现“一键安装”。
  • 模型与技能库:内置 Kimi、MiniMax、GLM、DeepSeek 等主流国产大模型,并接入 ClawHub 技能市场(沉淀超 5000 种预定义技能)。
  • 灵感广场:本次新增的免 Prompt 模块。针对办公提效、深度研究、娱乐等高频场景预设自动化流,自动加载底层 Skills,用户点击即可在本地 PC 执行复杂任务。
499 词

阿里发布企业级 Agent 平台“悟空”,钉钉底座完成 CLI 原生改造

阿里推出独立应用兼钉钉内置平台“悟空”,以原生 API 调度替代 GUI 模拟操作,从“个人玩具”级 Agent 转向企业级权限可控的业务流,标志着协同办公的底层驱动由人机交互转向 Token 执行。
CleanShot_2026-03-17_at_18.27.35@2x

交互底层重构:CLI 改造与原生 API 调度

“悟空”摒弃了市面上主流 Agent 依赖模拟人类点击图形界面(RPA/GUI 模拟)的脆弱路径。为配合该平台,钉钉进行了全面的 CLI(命令行界面)化改造,使“悟空”能够原生操作钉钉内部上千项功能。此架构实现了“沟通即执行”,在大幅降低执行延迟与故障率的同时,从代码层解决了企业真实业务中严苛的权限隔离、操作溯源与成本核算问题。

交付形态跃迁:场景化工作流与 Skill 生态

“悟空”即日起以独立应用形态开启邀测,并直接内置于超 2000 万企业组织的钉钉环境。其核心商业交付模式并非提供裸模型框架,而是“场景化 Skill 套件 + 预编排工作流 + 行业数据沉淀”的组合。阿里系 B 端商业资产(阿里云、1688、淘宝等)将陆续以 Skill 形式嵌入作为统一出口,平台同时宣布全面兼容开源 Skill 体系,以抢占 ToB 能力组件市场。

422 词

智谱推出专为OpenClaw(龙虾)Agent场景深度优化的基座模型GLM-5-Turbo,商业模式实质性从API按量计费向“数字员工”打包订阅服务演进。

核心参数与Agent定向优化

GLM-5-Turbo 支持 200K 上下文长度与最大 128K 输出 Token。该模型在训练阶段针对 OpenClaw 任务流进行专项优化,核心提升在于:增强 Function Call(工具调用)稳定性、复杂指令多级拆解能力、定时持续性任务处理,以及高吞吐下的长链路执行连续性。原生集成流式响应、上下文缓存(Context Caching)及 JSON 结构化输出。

定价上调与商业模式转换

智谱同步上调了 GLM-5-Turbo 的 API 调用价格,较上一代旗舰 GLM-5 涨幅达 20%(对比 GLM-4.7 累计平均涨幅达 83%)。同时,智谱推出 C端/小B端“龙虾套餐”,将售卖形式转化为订阅制服务:体验月卡 39 元(含 3500 万 Tokens),进阶月卡 99 元(含 1 亿 Tokens)。

605 词

科大讯飞正式切入“龙虾”(自动化 AI 代理)赛道,凭借沙箱隔离技术与跨多款主流大模型的调度能力,解决企业级协同办公的数据安全与复杂任务执行痛点。
iShot_2026-03-12_20.45.56

事实纠偏:非“养虾”农业工具,实为企业级 AI 代理

针对话题中的“主打安全养虾”,经核实系对行业最新术语“龙虾”(指代新型自动化 AI Agent 赛道产品)的误读。AstronClaw 并非水产农业工具,而是科大讯飞于 2026 年 3 月 12 日正式上线的企业级智能助手。

技术/事件点 A:底层安全与部署架构

  • 核心安全机制:采用沙箱隔离技术运行。该技术通过构建独立受限的运行环境,确保 AI 代理在处理企业私有数据及调用外部接口时的绝对隐私与物理级隔离。
  • 部署与集成链路:支持云端一键部署。目前已原生接入企业微信、钉钉、飞书等主流企业通讯工具。交互逻辑由传统的“应用内操作”转变为“自然语言对话直接指派任务”。

技术/事件点 B:模型调度能力与商业化参数

  • 多模型路由(Model Routing):平台内置调用 10,000+ Skills,打破单一闭源模型限制。支持在星火 X2(科大讯飞自研)、MiniMax-M2.5、Kimi-K2.5、GLM-5 等头部大模型之间自由切换,针对“行业分析”与“长文档处理”等不同场景动态分配最优算力。
  • 商业化验证:首购定价 16.8 元/月。为进行初期算力压力测试及获客,官方宣布即日起至 2026 年 3 月 20 日 10 点开启“对话不扣积分”的限免推广。
699 词

Google 发布支持文本、图像、音视频及 PDF 同源向量化的嵌入模型 Gemini Embedding 2,原生打通跨模态检索,并支持弹性维度输出。

原生多模态统一向量空间

Gemini Embedding 2(模型 ID:gemini-embedding-2-preview)改变了以往不同模态需要独立处理再对齐的传统链路,原生支持将五种模态数据映射至单一的向量空间。 具体输入限制如下:

  • 文本:支持最高 8,192 Tokens 上下文窗口,覆盖 100+ 种语言。
  • 图像:单次 Prompt 最多输入 6 张图像(支持 PNG/JPEG,控制台直传无单文件大小限制)。
  • 音频:原生提取音频特征,跳过语音转文本(ASR)的中间件步骤。
  • 视频:单次支持最高 120 秒无声视频或 80 秒有声视频(MP4/MOV)。
  • 文档:单次请求直接支持解析最高 6 页的 PDF 文件。

引入套娃表示学习(MRL)与基准性能

该模型集成了套娃表示学习(Matryoshka Representation Learning, MRL)技术。默认输出 3072 维浮点向量,但允许开发者根据向量数据库的存储成本和检索延迟约束,在不显著损失语义精度的前提下,将维度向下弹性截断(官方推荐尺寸为 3072、1536、768,最低支持 128 维)。

核心 Benchmark 数据表明其跨模态检索能力处于头部梯队:

  • 文本-代码(MTEB Code):均分 84.0。
  • 文本-图像检索(Docci):recall@1 达 93.4。
  • 文本-视频检索(MSR-VTT):ndcg@10 达 68.0。
  • 语音-文本(MSEB):mrr@10 达 73.9。
  • 多语言表现(MTEB Multilingual):得分 69.9。
547 词

智谱将开源智能体 OpenClaw 桌面化,通过“免环境配置+预置工作流+专属模型”消除部署门槛,完成 Agent 从开发者工具向标准化端侧应用的转化。
iShot_2026-03-10_20.56.37

运行环境工程化与多模型路由支持

  • 桌面级封装:提供 macOS 与 Windows 客户端,消除终端命令行操作与 Python 环境依赖,实现 1 分钟级极速本地部署。
  • 技能预置与 IM 挂载:出厂内置 50+ 高频 Skill(覆盖投研、代码、营销等)。支持以原生插件形式一键接入飞书等通讯平台,实现基于对话框的异步任务下发。
  • 模型路由:执行层与模型层解耦,除第一方 GLM 模型外,API 接口原生兼容 DeepSeek、Kimi、MiniMax 等第三方主流大语言模型。

Agent 专属基座与长链路浏览器接管

  • 调度中枢特化:内置针对 OpenClaw 场景定向微调的专属基座模型 Pony-Alpha-2(内测中)。在长时间运行、定时执行及密集 Tool-Calling 场景下,其任务规划的稳定性与响应速度优于常规通用大模型。

  • DOM 级网页控制:摒弃传统 UI 自动化脚本,底层直接集成智谱自研的 AutoGLM Browser-Use 能力。支持跨页面、多步骤的非结构化网页自动化流转,且允许调用本地默认浏览器的 Cookie 与登录态。

  • 官网:https://autoglm.zhipuai.cn/autoclaw

934 词

腾讯电脑管家团队推出的 OpenClaw(开源 AI 智能体,俗称“小龙虾”)封装版本,核心杀手锏是打通了微信/QQ 双端接口,让用户能通过聊天窗口远程指挥本地电脑上的 AI 干活。
iShot_2026-03-09_20.23.28

1. 产品本质:官方“外挂”级封装

QClaw 并非腾讯自研的全新大模型,而是一个针对开源项目 OpenClawGUI 启动器(Wrapper)

  • 开发方:腾讯电脑管家团队(安全性背书)。
  • 核心功能:将复杂的命令行 AI Agent 部署过程“傻瓜化”,提供一键安装包,内置 Python 环境依赖和模型配置。
  • 模型支持:默认接入 DeepSeek-V3.2、Kimi-K2.5、Minimax-M2.5 等国产模型,同时支持用户自定义接入本地或云端 LLM。

2. 杀手级特性:微信/QQ 双端直连

这是 QClaw 区别于字节 ArkClaw、百度 ClawHub 等竞品的核心差异点:

  • IM 隧道技术:用户安装并绑定后,QClaw 会在微信/QQ 中生成一个“龙虾”好友(或机器人)。

  • 远程操控:用户在手机微信发消息,家中的电脑(运行 QClaw)即可执行复杂任务。

  • 场景示例:在地铁上发微信给 QClaw “帮我把电脑桌面上的财报 PDF 总结成 500 字发给我”,QClaw 会在本地调用 Word/PDF 阅读器处理,并将结果回传至微信。

  • 无需公网 IP:通过腾讯内部服务器中转指令,无需用户配置复杂的内网穿透。

3. “养龙虾”黑话解读

  • 词源:OpenClaw 图标为红色钳子,酷似龙虾,社区因此得名。
  • 含义:“养龙虾”指通过持续投喂 Token(交互数据)、配置 Memory(记忆模块)和 Tools(自定义工具脚本),让初始只有基础能力的 AI Agent 逐渐熟悉用户的电脑环境和工作流。
  • QClaw 的作用:降低了“养殖”门槛,让不懂代码的普通用户也能拥有一个能读写本地文件、操作浏览器的“数字员工”。

4. 安全机制:沙箱(Sandbox)

鉴于 OpenClaw 本质是让 AI 获取电脑的 CMD/Terminal 执行权限,风险极高(如 AI 可能误删文件)。

  • QClaw 方案:集成了腾讯电脑管家 18.0 的“AI 安全沙箱”技术。

  • 权限管控:对 AI 的高危操作(如删除系统文件、格式化磁盘、发送敏感数据)进行拦截或弹窗二次确认。

  • 腾讯 QClaw 官网 (内测)

590 词

腾讯元宝团队推出独立桌面客户端,主打“零代码/零部署”的开箱即用体验,具备屏幕上下文理解能力,意在通过 OS 层级交互抢占 PC 端办公流量入口。
iShot_2026-03-09_20.21.57

1. 产品形态与定位

  • 独立客户端架构:不同于网页版 Chatbot,WorkBuddy 以独立桌面应用(Windows/macOS)形式存在。
  • 开箱即用(Out-of-the-box):核心卖点为“免部署”,直接通过官网下载安装包即可运行。这旨在降低用户门槛,与 GitHub 上需要复杂环境配置(Python/Docker)的开源 Agent 项目形成差异化。

2. 核心技术能力

  • 屏幕感知(Screen Context):具备读取当前屏幕内容的能力。用户无需手动复制粘贴,AI 可基于当前浏览的文档、网页或代码界面直接进行分析、总结或提取数据。
  • 跨应用协作:突破了单一浏览器窗口限制,能够与本地办公软件(Office 套件、钉钉/企微等)进行联动。
  • 模型底座:底层接入腾讯混元大模型(Hunyuan),提供多模态理解与生成能力。

3. 功能场景

  • 沉浸式辅助:支持划词解释、侧边栏即时对话,类似微软 Copilot 的系统级集成体验。

  • 自动化工作流:支持一定程度的 GUI 自动化操作(如自动填写表格、整理会议纪要并发送),即向 LAM(Large Action Model)方向演进。

  • 官方网站:https://www.codebuddy.cn/work/